获奖论文 | 王士博:论法定犯的算法证明方法
(题字:北京市书法家协会理事,北京市丰台区书法家协会主席团成员、副秘书长,民盟中央教育委员会委员韩国强)
王士博 | 中国人民公安大学诉讼法学博士生,研究方向:刑事诉讼法学、证据法学。
本文曾在天津市法学会诉讼法学分会与靖予霖天津律师事务所合办的2021年年会征文中获奖。发表于最新一期《证据科学》(2022年第4期)。感谢王同学授权“司法兰亭会”新媒体推介。
【摘 要】算法颠覆了传统要件事实的单一人工认定模式。算法参数根据构成要件来搭建,海量数据集作为证据的“此岸”通过算法证明到达要件事实的“彼岸”,因此算法是一种技术证明方法。
但算法证明并非适用全部犯罪形态,法定犯因其行为规范的强结构化、行为证据的电子数据化及事实认定的“形式化”,便于算法证明的框架建构。
自方法论意义而言,算法证明的本质是利用数学统计方法解决证据推论问题。算法证明方法与印证并无冲突,算法证明方法具有证明过程的进阶性、证明方向的一致性的特征,是权力主导型证明结构,因此算法证明与印证证明是包含关系。
鉴于此,基于法官既有的规范依赖型事实认知模式,应当建立算法的技术标准以解决证明领域的算法解释黑箱。
一、 问题的提出
2017年国务院发布《新一代人工智能发展规划》,将发展人工智能作为国家战略。我国各级审判机关积极探索人工智能与司法裁判的深度融合,实践的积极探索为学术探讨提供了靶向。就理论界讨论的具体内容而言,大致包括以下几个方面:
第一,人工智能司法决策的定位问题。对此,学界已达成基本共识,司法人工智能只能辅助法官改善司法产品的品质,而不能取代以理性与情感为判断基础的法官。基于此,在理念上,面对经由算法的司法决策,提出建构算法正义,完成算法司法决策的价值填补。在实体上,人工智能注入司法领域,针对随之而来的算法歧视、算法黑箱等问题,建立算法监督专员,完善归责制度。
第二,构建人工智能推理模型。人工智能推理模型可分为法律推理与证据推理。学界对此问题的讨论基本采用符号主义的路径,在元理论层面建构法律领域的推理与人工智能的沟通方式。
第三,聚焦于人工智能技术给刑事证据体系带来的变革。基于算法分析海量电子数据生成的结论,有学者提出大数据证据概念,并论证了大数据证据具有独立证据类型的意义,以及对事实认定的影响。
总体来看,司法场景中人工智能不仅在最基础的层面上提供支持性技术,还可部分代替传统由法官完成的司法决策。但大部分论者仍立足于法学领域对人工智能“指手画脚”,这种“设想”式的讨论,缺少对算法具体运行程式和算法能力边界的把握,即算法作为工具本身的不能,导致其论证如堕烟海。
实际上,算法在法学场景中的应用主体是专家系统算法,即基于专家经验和法律规定构建算法规则。不论是司法决策、推理模型或者大数据证据,从输入端的要素数据到最终输出的结构化数据,其分析程序都依赖于确定性的规则和逻辑。若应用基于数据经验的机器学习算法,则意味着放弃了对分析程序的人工干预,动摇了司法的程序价值根基。从目前刑事司法实践来看,机器学习算法主要应用于侦查前端的线索筛查以及同一性鉴定中特征初步筛选。
基于上述学术研究现状,本文将算法介入司法具象化到证明场景。司法裁判包括定罪(事实认定和法律适用)与量刑,目前实践中的“共治”集中于量刑领域,如上海高院的“206系统”中量刑参考、美国的COMPAS系统等。但算法能否适用定罪?事实认定作为定罪的基础,强调证据组合的结构化与逻辑性。而就算法技术本身来说,在输入端,必须将欲分析的事物进行特征化、数据化描述。同时,算法证明是在输出端输出待证事实,因此构成要件需可转换为规则代码。算法输入端与输出端的要求决定了其在事实认定中应用范围的有限性。
加罗法洛以道德悖反和规范违反为标准区分了自然犯与法定犯两种犯罪形态。自然犯因其具有伦理非难性而需要实质性的价值判断,而价值判断一直是人工智能领域难以攻克的技术难题。自然犯事实认定所需要的知识库难以被形式化为计算机语言。
相比之下,法定犯的入罪基础是规范违反,其本质是为了行政管理的需要。法定犯的认定是犯罪行为与规范事实进行匹配的形式性判断,价值判断较少,这与人工智能技术的平面化、形式化特征相契合。
在现代刑法中,法定犯主要是经济犯罪。并且在实践中,算法证明主要应用于经济犯罪案件。资金流在经济犯罪中是侦查的重点,而银行账户交易记录呈现出海量化、同质化的特点,需要将海量的资金交易数据进行结构化聚合,揭示其中的数据规律,仅凭传统的印证证明方法难以条分缕析地对其进行组合、推理。通过算法刻画资金交易数据的规律,从而完成证明。
实践中侦查机关已经开始使用算法证明案件事实。如在胡某组织、领导传销活动罪一案中,常德市公安局对传销网站后台数据库进行分析,出具的电子数据检验分析报告为:胡某注册账号总数120……账号下发展会员人数2434,推荐会员账号RM10×××05,所处层级10,下线层数75。
该分析报告证明了两个待证事实:犯罪嫌疑人发展的会员人数和传销层级数。不难看出,实践中算法证明聚焦于次终待证事实,即最终待证事实的要素事实,而非通过分析整个案件的证据推理出最终待证事实。
鉴于此,本文无意建构司法裁判人工智能化的宏大图景,而是聚焦于事实认定的场域,基于法定犯的规则结构与证据的高度数据化,其与算法具有较高的契合度,将算法在法定犯事实认定中的作用明确为证明方法,其与印证证明是包含关系。立足于法官既有的规范依赖证明模式,提出构建司法证明领域的算法标准的规制路径。
二、法定犯证明方法可算法化的现实基础
摒弃算法应用司法裁判的“全能论”,转向证明部分要件事实的要素式算法建构,需基于算法的技术特性与法定犯证明之中寻求共治的基础。
(一)构成要件行为的可模型化
虚拟空间中犯罪行为以数字形式存储,海量电子数据呈现出离散化、同质化、低价值密度的特点,需以整体性数据所凝练的规律性认识来证明待证事实。尽管具有不可直观性,但是其依然符合构成要件行为的类型化。
因此,法定犯构成要件行为的可模型化成为算法证明的关键,其涉及两个理论前提:一方面是法定犯具有稳定且具体的行为结构。法定犯中的“法”指的是行政法规,其基本犯罪结构可以公式化为行政违法+加重犯(情节加重或结果加重)。行政法规作为前置性法律文件,法官的司法认定依赖其对违法事实构成要件的规定。
行政违法行为在总体上呈现出“行为犯”的特征,大多无需以损害结果的发生为成立要件。从功能上来说,行政处罚主要是对违法行为的惩戒,其所关注的主要不是违法行为已经带来何种后果,而是将会造成何种后果。
行政违法的构成要件以行为为中心,这决定了其需将违法行为特征详尽描述,行为特征的组合结构需泾渭分明地区分合法与非法的功能。如组织、领导传销活动罪,其前置行政法规《禁止传销条例》第7条详尽规定了传销行为的种类,传销行为并非是一种自体恶,而是禁止恶,因此其依存于法律创制。
可以说,法定犯证明是一种填补式的“形式”判断,只要行为符合规范设定的行为类型即可完成。亦即从规范事实的角度而言,其受到来自法定犯的结构制约力较强。这与算法0和1的二值代码逻辑相契合,便于代码转化。
相比之下,自然犯的类型化行为较为抽象。如故意杀人罪,刑法采用简单罪状表述为“故意杀人的,处……”。将所有侵犯生命法益的行为抽象为杀人行为,其行为样态和结构具有多样性,且对杀人行为的判定是需要伦理经验的实质判断。因此无法将其行为结构进行数字化建模。
另一方面是数据分析以算法模型为大前提。与人类分析思维相似,算法的运行也是预设-分析模式,其基本的假设是模式会重复。从算法程序运行的逻辑上来看,算法设计者是将现实世界的逻辑映射到算法模型中。算法模型是数据结构的抽象化模板,是使数据结构化的中心环节。
根据算法模型的生成机制不同,可分为专家系统的规则模型与机器学习模型。机器学习算法模型是一种模型生成自动化工具,可自动学习并构建数据中各种特征的相关关系。机器学习算法所输出的模型并非准确,其输出的模型不仅仅造成“黑箱”,而且还会产生错误的相关关系。专家系统的规则模型是指借助既定的司法规则、司法经验,人为构建算法规则。
换言之,专家系统利用专家经验进行模型搭建,而机器学习是以数据经验为基础自动搭建模型。法定犯的类型化危害行为有明确的规定,其特征也相应地具有法律规定性,这就要求算法模型中的规则必须透明并与法律规定相一致。
因此,法定犯的证明算法,是为了处理个别的、具体的案件产生的行为数据,由专家设定其算法参数及算法逻辑,是一种专家系统规则模型。而机器学习生成的算法模型是“机器自主生成规则”,存在参数之间规则的黑箱,其生成的模型可能与法律规定不符,这违反了罪刑法定原则。
(二)行为证据的电子数据化
网络时代的到来,创造了一个既依托又超越于物理空间的虚拟空间,形成了物理空间-网络空间交融互嵌的二元架构。人们通过“指尖行为”和人机交互界面输入指令,触发既定的程序规则,完成虚拟空间的数据交换,数据交换形成海量的数据存储于服务器中。
网络平台是人机交互的界面,物理环境下的点击行为只是输入指令,其背后是以算法为核心的代码程序。虚拟空间的指令输入与算法程序共同完成了刑法评价意义上的行为,不同的指令触发不同的程序运行结果,任何操作的信息指令必然要依次经历由系统软件层、操作系统层,到磁盘存储设备层的转移。通过指令输入输出结果。
基于指尖行为输入的指令,网络平台(包括网站和APP)设计数据交换的算法规则,算法通过自动处理输出指令进行数据交换,从而完成不同的指令所设定的程序结果。人类在现实世界的活动得到了前所未有的记录,这种记录的粒度(即数据的细化程度,细化程度越高,粒度就越小;细化程度越低,粒度就越大)愈小,频度在不断增加,为电子证据的收集提供了极为丰富的数据资源。
从整体角度观察电子数据所在信息系统,其地位和作用并不是简单地表现为一个个或者一类类独立的证据,而是一个“现场”,由信息系统生成和记录着各类信息,这些信息往往足以重建“过去发生的事情”。
“数据现场”由数据内容、行为信息、系统信息和附属信息组成。如一条转账记录,除了转账时间、金额、账户信息等内容信息,还包括行为信息的操作记录,转账指令信息传输到银行服务器所遗留的系统日志、安全日志、数据库日志等系统运行信息,以及上述信息打包存储在服务器的创建时间、修改时间、大小等附属信息。换言之,物理空间的“指尖行为”在虚拟空间通过数据形式被完整的记录,犯罪行为被完整地刻画于电子数据之中。
(三)法定犯证明的“形式”化
在自然犯证明中,证据与事实之间的推理需要生活经验充当大前提。而证据推论所依赖的大前提为一个全真命题的情况是罕见的,通常带有模糊量词。
例如英美法系中的经验“已经在法庭上宣誓的证人很少说谎”,“很少”就是一个模糊量词。而算法是基于数学逻辑,其具有确定性、逻辑必然性和单调性的特点。算法是以0和1为基础的二值逻辑,只能以“非此即彼”式运行来消除矛盾因素。
模糊性且不确定性的经验难以转化为算法语言。考虑到算法确定性与经验事实模糊性之间的矛盾,司法人工智能领域演化出基于先例的裁判模型,利用机器学习算法对大量打标签的裁判文书进行学习,输出算法模型,以对其他案件进行“裁判”。
此种裁判模型有过拟合和泛化能力差的缺陷,其输出的裁判结论缺乏创造性的价值判断,颠覆了裁判生成的正当性基础。倘若采取此种裁决的技术路径,“难以再见到像马伯里诉麦迪逊案件这样具有时代意义的伟大判决了”。
而法定犯具有明确的行为结构标准,是否符合构成要件的规定通常十分清楚明了,是一种“非此即彼”式的形式判断。法定犯与自然犯在行为结构强弱的差异,影响着证据推论的逻辑。
法定犯是以规范事实为大前提,而自然犯以经验概括为大前提,自然犯中经验概括“必要且危险”,决定着结论的可接受性。法定犯的形式化证据推论为其算法转化提供了逻辑基础。
遵守形式的法律标准是司法人员法定义务,若是这种形式性的法律标准与实质的价值判断之间存在冲突,则通常只能考虑通过量刑阶段的从宽处理来解决。无意去评价法条主义下形式性判断的优劣,但证明的形式性判断毫无疑问地便于建构算法化规范框架。
三、法定犯算法证明方法的原理
法定犯证明方法的可算法化只是“共治”的基础,而算法如何证明则是“共治”的路径。
(一)一个并非不证自明的命题:算法是一种证明方法
在我国台湾地区以及日本,以证明对象划分为严格证明与自由证明。严格证明与自由证明是将证据置于诉讼程序之中,严格证明之严格性表现在法定证据方法之限制和法定调查程序之限制。
法定证据方法指的是探求证据信息的调查手段,在严格证明限制下,必须能够归纳于五种列举的证据方法(人证、文书、鉴定、勘验和被告之自白),才是法定的证据方法,才得据以认定犯罪事实并采为裁判基础,并无所谓的例外可言。
证据方法是程序与证据结合的产物,是在刑事诉讼程序规则下探知证据信息的方法。因此,探求证据本身承载的信息是证据方法的终点。证据方法有特定的适用主体和场景,即证据方法是法官在审理程序中调查证据之方法,特定证据方法经过法定调查程序之后,方取得证据能力,以作为裁判之基础。
所谓证明方法,指的是从证据到待证事实这一推论过程所使用的手段,要件事实是证明方法的终点。事实与命题具有同构性,证据事实和待证事实的表达以命题的形式出现。证据到待证事实的证明过程也是证据论证待证事实命题的过程。
论证按照方向的不同分为“证实”与“证伪”,分别是控方与辩方在司法证明活动中需要达成的目标。根据论证的路径不同,英美主流证据法理论中证明方法可分为:属于整体主义方法的故事模型理论和属于原子主义方法的论证方法。
无论何种证明方法,其目的皆为从证据推论出待证事实,其主要价值是作为组织、排序或构建证据并从证据中得出推论的工具。如使用鉴定方法对现场的指纹进行比对,探求指纹本身的信息是识别与认知证据的过程,因此鉴定属于证据方法的一种。而根据指纹证据推理出犯罪嫌疑人曾在犯罪现场出现,这是证明过程,要证明犯罪嫌疑人实施了犯罪行为这一待证事实,还需将其他证据进行逻辑上的组合。
在触网犯罪中,数据分析的目的在于判断行为是否符合刑法规定的构成要件。因此,算法模型作为数据结构化的模板,其构建必须以构成要件特征为依据,将犯罪行为的数据特征模型化。
换言之,算法模型实际上是构成要件的代码形式。以组织、领导传销活动罪为例,其犯罪构成行为特征有:组织者或经营者要求被发展人员发展其他人员,并以发展人员的数量作为计酬返利依据;组织者或经营者要求发展人员缴纳费用;形成层级,以下线的销售额计算上线报酬。与构成要件的行为相对应,其资金数据交易特征有资金汇入特征、资金特征、返利特征,这些数据特征经由数学模型化为算法模型。
由此观之,在数字场景中,算法模型实际上是数据行为的类型化。通过对构成要件行为特征的代码转换,使其由现实世界的法律规则转变为数字世界的代码规则,构成要件的行为被重构为0和1的组合。
可见,算法模型本身是按照构成要件行为的“彼岸”来构建,经算法分析而产生的规律,已经跨越了“证据→要件事实”之间的波涛,从电子数据的“此案”到达了构成要件行为的“彼岸”。因此,行为数据经由算法模型分析后,不能称其结论为一种新型证据材料,而应当是部分要件事实。
(二)算法证明的本质维度:数学统计方法
算法证明方法的实践价值在于解决触网犯罪行为证明问题,其方法本质是以数据特征为基础搭建专家系统模型,运用描述性统计方法挖掘海量电子数据的特征规律。由于个案行为特征不同,海量电子数据所表征的规律各异,因此,筛选数据所使用的参数条件也不同。
基于此,本部分以经济犯罪案件中对资金交易数据(其他可分析数据包括物流数据、通讯数据以及社会关系数据等)的算法证明过程为例进行论述,大体上分为三个步骤:缩小关键账户、查找特征金额和可视化关系分析。
与现实空间相对应,虚拟空间的行为主体表现为银行(或第三方支付平台)账户,账户的交易数据表征行为。海量交易数据中混杂着犯罪行为人的账户、被害人账户、资金池账户、即进即出中间账户等。其中的交易关系盘根错节,关键是剥丝抽茧地找到行为人的账户,进而聚焦于该类账户的交易数据进行重点分析。
在经济犯罪案件中,使用“交易账户与对手账号交易汇总统计”模型,可以根据不同案件行为账户的特征进行筛选统计。如在组织、领导传销犯罪中,层级越高的犯罪嫌疑人,其账户交易的进账和交易次数越多。因此可依据账户的入度和出度缩小账户范围。
在统计出重点嫌疑账户后,再根据不同类型犯罪的交易特征金额进行分析。分析金额特征的目的是找到与行为人账户有犯罪上下游关系的对手账户,对手账户的性质可通过金额特征进行鉴别。
各类经济犯罪因犯罪行为的形态不同在资金交易金额上表现为不同的特征,这种金额特征是由实体法所规定的行为类型化所决定。“类型是建立在一般及特别间的中间高度,它是一种相对具体,一种在事物中的普遍性。”刑法中此罪与彼罪一个外观性区分标准就是行为,不同的行为类型由于具体的犯罪目的差异而具有异质性,这种质的规定性差异在外观上表现为特征的差异。
换言之,特征是探求特定犯罪行为本质之后显露于外的质的区别性。因此,行为特征具有区别此罪与彼罪的标准意义。
而在经济犯罪中,犯罪行为表征为数据,行为特征表征为数据特征。如非法买卖外汇类案件,行为人账户的交易金额特征可能呈现出汇率的整数倍。在组织、领导传销活动犯罪中,因上下层级之间存在返利关系,其交易的金额特征可能呈现出固定的比例。可见,不同的案件类型决定了行为特征以及数据特征的差异,因此算法的行为建模是一种具有个案针对性的具体技术方法。
可视化利用图形形式,对数据进行图形化转换。可视化分析与上述统计方法不同,可视化是以账户为节点,以交易关系为边且依据交易频率(或金额)将边赋权,形成犯罪网络关系图,如侦查机关出具的传销人员网络图,其可清晰地表示犯罪人员的层级和上下游关系。
当然,上述步骤在实践中是交替进行的。在可视化分析之后,可能会发现新的犯罪账户节点,需再对该账户交易数据进行研判分析,最终形成账户关系网络。
在统计学意义上,缩小关键账户是统计分组,将明显异常账户与其他账户分离,再基于金额特征对交易明显异常账户的数据进行统计计算。可见,算法的本质是各种统计分析应用,算法是以数据统计的方式进行证明。
经过上述数据分析后,资金交易的数据特征已经明了,数据特征所对应的类型化犯罪行为也已清晰,并完成了对犯罪人数以及犯罪行为的证明。但这并不意味着完成了最终意义上的证明,由于账户交易数据同质化程度极高且来源相同,并不能互为补强证据,而应将其视为一个整体,根据“孤证不能定案”的原则寻求其他证据与之印证。
四、法定犯算法证明方法的法律地位
算法证明方法颠覆了传统单一人工事实认定模式。讨论这种新型证明方法必须要充分考虑现行证明模式并要与之兼容。因此,需探讨算法证明方法与印证证明的关系样态,这也决定着法定犯算法证明方法的法律地位。
(一)算法是进阶式论证
案件事实的构建是以单个证据推论形成的“碎片”事实组成。在2012年United States v. Jones案中,美国联邦最高法院认为长达28天的GPS定位侦查积累了大量零碎行踪信息,如同将大量马赛克碎片并在一起呈现完整图像,认定其构成违法搜索。
马赛克理论(Mosaic Theory)认为海量单个数据整合行为会对隐私权产生更深层次的侵犯。虚拟空间在形态上表现为数据构建的巨大的信息空间,以数据形式记录行为痕迹,形成巨大的数据资源池。
从数据池中调取的犯罪行为数据具有零散化的特点,单个数据作为证据所证明的事实过于微观,以至于其是否具有关联性无从判断。如上述案件中Jones从某地到另一地的单一行程轨迹无法证明其涉嫌毒品犯罪,但整合28天行踪监控轨迹数据,就可以发现其行为规律,并建立起其与涉嫌藏匿毒品地点之间的联系,从而与案件实现关联。
但是,轨迹数据仅证明Jones在空间上与藏匿毒品地点具有相关关系,欲证明Jones贩卖毒品,还需要Jones和其同伙具有贩卖行为等证据。否则,在中国此案很可能只能指控其非法持有毒品。
可见,刑法规范是众多要件要素的集合,就案件事实的终局性证明而言,电子数据的体量即使再大,也不能形成论证的闭环,算法证明并不是完备的证明,其只能证明部分要件事实,且结论并非是无可辩驳的。
统计方法决定算法证明的结论具有似真性,仍需证明数据行为背后的目的以及现实空间其他类型证据进行印证。自统计学的角度而言,数据规律是量的叠加,量的累积达到何种标准才能做出定性判断,存在疑问。因此,算法证明方法不是一种终局状态的证明。欲完成全局性证明,还需要其他证据通过印证证明方法进行证明。
与之相同的是,印证在量上的要求是“孤证不能定案”,印证本身就体现出两个以上证据之间的相互关系。印证凭借证据信息和指向的同一形成完整的证据链条,其核心要义在于证明意蕴的叠加,相互印证的证据数量越多,印证的可信度就越高,因此,印证注重的也是过程状态,并不强调完成状态。
(二)算法证明方法中包含“一致性”要求
自算法证明机理观之,在算法证明中,算法模型运用各种数据参数来建构一个标准的、并符合算法设计者预期的完美“主体”形象,将完美的主体形象用以评价真实的个体,这个由算法模型生成的完美的主体形象实则成为评价个体的基本参照系。
而这个基本参照系是否完美,决定着证明结论是否准确。算法证明关注证据信息间的相关性,即电子证据信息间的数值关系。而这种量化的相关关系背后,是以数学方程模型进行支撑。数学公式模型必须与欲论证的命题逻辑相洽。
在数学方程模型中,逻辑方向一致性体现为数据的拟合性。如上述组织、领导传销活动罪中,倘若海量数据没有呈现出规律性,其与数学模型欠拟合,必然呈现出不规则的点状离散状态。
因此,海量数据中的每一单个数据都不是“无辜”的,都为规律性贡献了力量。当海量数据经过算法模型得出规律性结论,其与构成要件行为特征相符,即完成了证明。换言之,以规律性认识发挥证明作用,需判断点状数据是否拟合数学模型,进而可判断数据规律是否符合构成要件行为特征。
印证证明方法所蕴含的证据信息一致性内容,实际上是真理融贯论在证据方法的体现。融贯论的基本观点是系统内部的协调一致性与无矛盾性。海量数据经由算法模型分析所得出的规律性认识,同样具有证明方向一致的特征。
但稍有不同的是,海量数据并非完全拟合数学方程模型,而是有一定的离群值。离群值影响海量数据拟合数学方程的优度。质言之,当离群值较多时,海量数据可能不符合规范行为规律。
鉴于此种情况,应当结合其他证据探求离群值的原因。如果没有其他证据印证,则犯罪嫌疑人可能不构成犯罪。当离群值较少时,一般不影响规律性认识,可对其剔除或忽略。
(三)算法证明与印证同属“权力主导型”证明结构
在事实认定方面,诉讼中存在控诉、抗辩证明和裁判者心证三个证明系统。法庭上的证明过程应当是辩证的、动态的,基本的辩证情景要求存在对立的观点以及对这些观点的批判性检验。
但在我国司法实践中,裁判者心证系统受到控诉证明系统影响最为深刻,其往往与控诉证明系统形成重合,拒斥抗辩证明系统。表现在裁判结果上为支持控方的有罪指控,对辩方意见不予采纳。
控诉证明系统对裁判者心证系统的影响也体现在证明方法上。证明强调的是控辩双方论证各自提出命题的过程,证明方法是论证这一命题的手段方法,控方使用的证明路径称为印证证明方法。而面向法官这一主体,法官并非证明的主体,法官使用印证方法应当称为印证裁判机制。
这种控方与裁判者使用同一证据推论方法的“权力主导型”证明结构,不同于图尔敏论证模型与威格摩尔图示法向辩方信息开放,其抗拒辩方信息的介入,表现为法官对控方所证明的事实予以认可。
实践中,裁判者心证系统对算法证明结论的接纳,为算法证明同属于权力主导型证明结构提供了注脚。如在陈某组织、领导传销活动一案中,针对辩护人提出的“电子数据检验分析报告中涉及的层级及发展的会员人数存在疑问”“应当由具有相应鉴定资质的机构出具鉴定意见”辩护意见,法官认为“电子数据检验报告是对数据库提取的电子数据进行检验和分析后得出,应当作为认定本案事实的依据”。
可见,尽管缺乏技术知识背景,但法官仍认定了算法证明生成的事实,控方使用的算法证明方法影响法官的心证,算法证明的事实被裁判者纳入到最终待证事实之中。
总之,算法证明方法中所蕴含的进阶式、一致性内涵与印证证明方法高度契合。另外,算法证明方法适用于法定犯中行为要件的证明,其证明的是部分事实要素,而最终待证事实的构建仍需证据之间印证。基于此,算法证明方法是印证证明的技术补充,其属于印证证明下阶的具体证明方法之一。
五、法定犯算法证明方法的规制
与印证证明不同的是,算法证明将计算机技术融入司法证明之中。而算法的稳健性、鲁棒性决定事实认定结论的准确性。此外,裁判说理需要算法具有可解释性,因此有必要对作为证明方法的算法进行规制。
(一)证明的新忧宿疾:技术黑箱与心证黑箱的互嵌
传统自由心证推崇裁判者“聆听内心的声音”,法律决策终结于“内在的感觉”,最佳的理性就是“源自内心最底层的呼唤”,秘密心证成为裁判者抵御追问与质疑的遁甲和解脱压力与责任的利器。
现代自由心证强调对心证的规制,讲求心证公开。对社会公众来说,了解法律的温度是通过一个个生动的案例,而非刻板静态的法条。对辩方来说,心证公开是其程序性权利和实体权利的保障,也是当事人信服与接纳判决结果之法理基础。
2009年12月最高人民法院发布《关于司法公开的六项规定》第五项规定:“裁判文书应当充分表述当事人的诉辩意见、证据的采信理由、事实的认定、适用法律的推理与解释过程,做到说理公开。”但在实践中,裁判文书一般只列出证据的内容而不对其进行解释和评价。
自法官的认知机制而言,其认知过程包含经验直觉与理性分析。法官所掌握的法律专业知识与经验是直觉加工系统的基础,这种加工机制是跳跃地、自动化地进行,个体不能明确表述自己获得结论的过程和方法,并伴有情绪反应。
可以说,法官在庭审过程中因庭审时间有限,更多地运用直觉机制。而在撰写判决书时,法官会对在庭审中由直觉机制形成的心证进行回溯性检验,因而在这个过程中更多地运用理性分析机制。但经由直觉机制形成心证的整个过程中包含大量“法感”难以言明,并不能充分地形诸文字。
此外,裁判文书公开使得外部的社会监督加强。为了规避类似彭宇案判决书说理的风险,法官刻意地将判决书说理部分简化,隐藏其心证形成过程。而列入副卷的“审理报告”“审结报告”以及审委会会议纪要却有相对详细的裁判理由,但其并不对社会公开。质言之,裁判者的心证公开“内外有别”。
前波未灭后波生,算法证明形成的技术黑箱不仅对于法官来说不能理解,辩方及社会公众更是不明所以。实践中法官尽管接纳了算法证明的事实结论,但并不具备专业知识对算法证明的事实进行审查。
算法证明形成了一个技术黑箱,算法证明的事实部分成为不可探明之灰色地带。因此,在判决书中呈现出算法黑箱与心证黑箱叠加的状态。
(二)法官对法庭科技的认知图景:规范依赖
从具体的算法规制路径上,很多学者以理解算法的内部运行逻辑的角度出发提出规制措施,如设定算法解释权利或算法解释义务。这从保护被告人的权利角度而言无可厚非,但是从法官事实认知模式的角度来说,法官缺乏算法专业知识背景,上述算法解释的规制路径无法解决“技术无知”的困境。
在传统事实认知模式下,法官运用经验和逻辑,凭借感官对证据信息的察觉,对原生性证据所承载的信息进行逻辑推演。但实践中法官往往表达这样一种观点:希望证据立法能够细密、完备,特别希望其中能够详细规定各种证据的证明力及其判断方式,使法官在办案时能够有一个明确的指导。
而随着科学技术涌入证据领域,科技所代表的技术理性替代了日渐式微的经验与逻辑,科学技术完成了对法庭事实认知模式的“技术占领”。而法律专家不可能是每个领域的专家,但他必须得是真正的法律专家才行,这样才能在法律的基础上甄别其他专家的同行意见,然后作出法律上的妥当决定。
于是,“法官是法庭的国王”这一传统共识也被打破,技术专家成为与法官分庭抗礼的角色。大多数科学技术都具有自身的缺陷和风险,而法官需要审查的不是出现在法庭上的科技是否是完美的,而是如何评估一个不完美的研究,从不完美的知识中进行事实认定。
司法程序并不是一个无限追求实质真实的场域,若要求法官通过掌握相应的科学知识审查算法,在实践层面无法实现。法官面对专业知识的无力使我们面对这个问题时似乎束手无策。
但从实践来看,法官对专业知识的认知往往设定一个“锚点”。美国科学证据的可采性标准中的Frey标准以及Daubert标准将法官的认知锚定在科学原理的“同行普遍接受”“是否可检验”“检验的错误率如何”等标准之上。而中国法官对鉴定意见的采信锚定在替代性审查机制上。可见,法官在面对科学技术时往往规避“外行审查内行”的局面,而是依赖于技术法律规范以认定事实。
鉴于实践中对事实认定规则的依赖和算法技术的专业性壁垒,寻找替代性测度机制成为审查算法证明结论的良方妙药。将法官审查算法的压力传导给技术性规范,法官只需要在法庭上做出形式审查即可。因此,可将算法规制的节点提前,即设置作为证明方法的算法规范标准,消弭法官对算法证明结论的审查困境。
(三)算法证明的替代性审查路径:算法标准
法律与科技的关系是一个持久的话题,法律在应对单一功能的技术时,往往在事前设定技术和质量标准,并在事后通过落实侵权责任进行损害赔偿救济。技术的标准并非在技术应用的初期设定,而是实践中经验和教训的总结,是技术细节凝练之后的产物。因此,技术标准的制定具有滞后性。
实际上,技术标准正成为践行算法规制的重要场所。如中央人民银行发布的《人工智能算法金融应用评价规范》对金融场景下的算法设定了算法标准。在警企合作的大背景下,各地侦查机关使用的软件算法大相径庭,这会导致算法证明结论的差异,进而对证明结论的准确造成影响。
证据场景下,算法的科学性就体现在其标准化程度,标准化为法官审查算法提供了基点,消解了法官算法知识不足与算法证明结论之间的紧张关系,符合“将专业的事情交给专业的人做”的分工机制。法官通过对算法的形式审查是否符合算法标准来认可算法证明的结论。
如果算法的应用没有标准化,那么证明场景中算法准入门槛、算法的升级迭代会变成没有限制的无序发展。同时,司法算法标准化能够克减算法技术的资本色彩,提供技术支撑的企业所具有的私利性与司法证明所具有的公共性之间的矛盾得以缓和。
更重要的是,设定司法算法的标准能够对算法进行解释,可以防止法庭审判因过分纠结技术而拖延。算法解释源自对算法运行逻辑的不信任,算法技术所产生的黑箱更是对以公开透明为目标的社会运行形态的悖反。
美国学者研究发现,人们对算法普遍具有一种“算法厌恶”(Algorithm Aversion)的心理。而构建算法信任,需要人们对算法的信任倾向和算法自身的可信度两个方面。建立司法算法标准是“毕其功于一役”的路径。
当然,技术的应用一般是“先兴起,再治理”,算法标准的制定也应当等待算法技术实践经验的沉淀。过于急切地在算法应用的早期制定算法标准,不仅不利于事实的认定,反而有限制证明领域算法的发展之弊端。
从算法标准的制定主体来看,算法的国家标准可以由公安部物证鉴定中心负责制定。由于各地区公安机关合作的企业不同,算法的使用呈现地域性差异。因此,可以制定与细化国家标准的地方标准。
从标准的内容来看,构建算法证明模型分为三个步骤:犯罪行为特征提取、特征转换数学模型和数学模型代码化。可以发现,尽管算法标准解决的是仅仅是第三个步骤的问题,但是前两个步骤决定算法模型可靠、合法的关键。
因此,在标准制定前,应当组织由法学和计算机专业的专家、学者以及实务部门的工作人员组成的算法标准化委员会,承担算法模型构建的前两个步骤的标准化工作。目前,公安部经济犯罪侦查局就针对各种经济犯罪类案件在公安系统内部云系统上传了算法模型,但是尚未与检察院、法院共享。建立算法标准时可以借鉴其算法模型。
六、结语
以算法为主导的智能科技已经全面渗透到社会运行的毛细血管之中,证明领域也不例外。法官事实认定的模式也发生了改变,从论证到建模、从经验到计算,数字与数据已经悄无声息地占领了裁判场域,重构了法官的认知模式。
算法已经融入社会运行体系的各个领域,算法模型替代人类自动化决策,成为每一个领域无法摆脱的影响性或支配性力量,我们每个人都“困于”算法运行系统中。
在愈发紧张的人机关系中,对算法的规制呼声不绝。而回应呼声的解决之道在于建立算法标准。同样的,证明领域更需要建立算法标准来克减法官因审查算法而带来的压力。
国务院在2017年发布的《新一代人工智能发展规划》中,制定了人工智能发展的战略目标,即到2025年,初步建立人工智能法律法规、伦理规范和政策体系,形成人工智能安全评估和管控能力。在规制算法时,法律需要汲取技术发展的沉淀,降低算法规制对既有的体系和实践造成较大的风险。
参考文献与注释:
以下点击可读:
获奖论文 | 全媒首发 | 侯芳郁:区块链技术下电子证据的推定真实——以技术核验为视角
获奖论文 | 全媒首发 | 陈文海:监检衔接视角下的监察机关调查权透视
新媒首发 | 王玉晴:社会保障视角下法律援助制度的功能定位——从与社会救助制度的关系入手
刘品新:论区块链证据 | 提前展示的精美课件 | 法大“证据科学春季论坛”第一讲
周跃、江溯、张洪铭、高显嵩、陈鑫、朱桐辉视频课程 | 揭开律师实务神器“区块链证据”的神秘面纱|周泰实务讲坛第一期
南开“信息安全—法学试验班”周嘉辰:区块链存证的流程、风险及完善
直播|程雷教授主讲、周泰共话:聚焦“取保候审”新规(内有抽奖福利)
允公允能 日新月异 | 南开招办给入校二次选拔成功的陕西新生的喜报
征文及论坛:数字社会治理中的公私合作 | 第二届数字正义论坛
新媒首发 | 罗猛、温军、赵晶、吉驰、刘晓晗、王鲁玥:监狱巡回检察实践中的问题及对策—基于北京团河地区人民检察院的实践
编辑 | 朱桐辉:南开大学法学院副教授,北京云证国家数据司法鉴定中心学术部主任。